python_机器学习（2）聚类算法

最新推荐文章于 2024-07-16 17:02:33 发布

xumeng7231488

最新推荐文章于 2024-07-16 17:02:33 发布

阅读量908

点赞数

分类专栏：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xumeng7231488/article/details/78304810

版权

本文介绍了K-means聚类算法的原理与应用，包括K-means的迭代过程和实际实验操作。同时，讨论了DBSCAN密度聚类算法，解析了核心点、边界点和噪音点的概念，以及DBSCAN的算法流程和实际应用案例。

摘要由CSDN通过智能技术生成

K-means聚类算法

k-means算法以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，而簇间的相似度较低。
其处理过程如下：
1.随机选择k个点作为初始的聚类中心；
2.对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇
3.对每个簇，计算所有点的均值作为新的聚类中心

4.重复2、3直到聚类中心不再发生改变

K-means的应用

数据介绍：
现有1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主要变量数据，这八个变量分别是：食品、衣着、家庭设备用品及服务、医疗
保健、交通和通讯、娱乐教育文化服务、居住以及杂项商品和服务。利用已有数据，对31个省份进行聚类。
实验目的：
通过聚类，了解1999年各个省份的消费水平在国内的情况。
技术路线：sklearn.cluster.Kmeans

K-means实验过程：

• 使用算法： K-means聚类算法
• 实现过程：
1. 建立工程，导入sklearn相关包

import numpy as np
from sklearn.cluster import KMeans

关于一些相关包的介绍：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。